2019 年 NoSQL 数据库 TOP 15:MongoDB、微软、Couchbase、AWS、谷歌、Redis Labs
作者:Forrester 的 Noel Yuhanna、Gene Leganza 和 Robert Perdoni
本文介绍了最重要的15家供应商以及各自的优缺点。
为何要阅读本报告?
NoSQL已成为所有企业支持现代商业应用软件的关键。Forrester按照26个标准评估了市场上的多家NoSQL提供商,选出了最重要的15家提供商:Aerospike、AWS、ArangoDB、Couchbase、DataStax、谷歌、IBM、MarkLogic、微软、MongoDB、Neo4j、Oracle、RavenDB、Redis Labs和SAP,并对它们进行了研究、分析和评价。该报告表明了每家提供商符合标准的情况,并帮助企业架构(EA)专业人员选择适合自身要求的提供商。
几大要点
MongoDB、微软、Couchbase、AWS、谷歌和Redis Labs一路领跑。
Forrester的研究揭示MongoDB、微软、Couchbase、AWS、谷歌和Redis Labs是市场的领导者,MarkLogic、DataStax、Aerospike、Oracle、Neo4j和IBM是表现优异者,而SAP、ArangoDB和RavenDB是竞争者。
性能、可扩展性、多模型和安全是关键的差异化因素
Forrester 评出的几个领导者支持一系列更广泛的使用场合、自动化、良好的可扩展性及性能以及安全产品。表现优异者在老牌提供商后面紧追不舍。竞争者提供较低的成本,正在提升核心的NoSQL功能。
大数据NoSQL平台的兴起
NoSQL已有十多年的历史。它已从支持简单的无模式(schemaless)应用软件,变成《财富》1000强大公司的关键任务型数据平台。它已颠覆了数据库市场,几十年来关系数据库供应商一直称霸该市场。如今,全球一半的数据和分析技术决策者已实施或正在实施NoSQL平台,充分利用适用于众多使用场合的灵活数据库具有的优势。企业喜欢NoSQL使用低成本服务器来扩展的功能,还喜欢一种灵活的无模式模型,能够存储、处理和访问任何类型的业务数据。NoSQL平台使企业架构专业人员能够更好地控制数据存储和处理,并提供加快应用软件部署的配置。虽然许多企业组织正在用NoSQL补充关系数据库,但一些企业已开始替换关系数据库,以支持改进的性能、扩展规模以及降低数据库成本。
Forrester对大数据NoSQL所下的定义是:一种非关系数据库管理系统,提供存储、处理和访问任何类型数据的功能,并基于一种无模式、灵活的数据模型,支持横向的、向外扩展的架构。
NoSQL供应商继续提供支持复杂工作负载的企业功能
NoSQL涵盖键值、文档和图形数据库等一系列非关系数据库,这类数据库针对新一代商业应用进行了优化,包括社交媒体、客户全方位、高级洞察力、实时和操作型应用。NoSQL供应商正在提供创新的功能,比如AI和机器学习自动化、与Apache Spark和流技术集成、支持SQL和简化的API以及广泛的管理工具。寻求NoSQL平台的企业应物色这种供应商:
关注AI /机器学习自动化部署功能:随着企业组织加大部署NoSQL数据库的力度,对更高自动化的需求变得至关重要。这包括自动化配置、调整、优化、索引、补丁、升级、高可用性和安全性。这些功能不仅加快部署,还轻松支持更庞大更复杂的应用软件。企业买家应留意AI/机器学习自动化产品的种种差异,并结合现在和将来的情况将它们与具体要求对应起来。
强调开源的优点:数字化转型常常在开源软件上开展。如今开源NoSQL解决方案已很稳定,准备好迎来黄金时段。企业喜欢NoSQL的诸多优点:迅速发展的生态系统,低成本,最大限度地避免供应商锁定现象,更容易针对复杂的部署进行定制。虽然许多NoSQL供应商提供开源解决方案,但应物色这种供应商:领导活跃的NoSQL社区,贡献软件以改进开源平台,并与客户共同积极推动创新。定价、包装和支持服务也是供应商的差异化因素。
与庞大的工具和技术生态系统集成:NoSQL数据库是构建优秀的现代业务应用软件并支持高级洞察力的基础。然而,NoSQL需要一个强大的生态系统,合作伙伴提供的工具和技术可以帮助加快部署。这包括支持数据集成、数据质量、安全、治理、分布式管理和数据管道的工具。选购NoSQL平台时,企业架构专业人员应考虑供应商支持的合作伙伴关系具有的广度和深度,以充分利用它们的工具和服务。
评估摘要
Forrester Wave评估报告重点介绍了领导者、表现优异者、竞争者和挑战者。报告评估了市场上的主流供应商,并不代表全部供应商。你可以在我们的NoSQL提供商概述报告中找到有关该市场的更多信息。
我们只是打算将该评估作为切入点,鼓励客户使用基于Excel的供应商比较工具来查看产品评估并调整标准权重(见图1和图2)。点击Forrester.com上该报告开始部分的链接,即可下载该工具。
Forrester Wave™:大数据NoSQL 2019年
Forrester Wave™:大数据NoSQL记分卡2019年:
供应商产品
Forrester在该评估中介绍了15家供应商:Aerospike、AWS、Arango DB、Couchbase、DataStax、谷歌、IBM、MarkLogic、微软、MongoDB、Neo4j、Oracle、RavenDB、Redis Labs和SAP。
评估的供应商和产品信息
供应商介绍
Forrester分析披露了每家供应商的下列优缺点。
领导者
MongoDB仍是最受欢迎的NoSQL数据库:MongoDB被8000多家公司所使用,其中包括许多《财富》100强公司。MongoDB在应用软件开发人员中颇受欢迎,主要是由于它易于使用、简化的模型、按需弹性扩展、多云支持和全面的工具。4.0版本发布后,MongoDB提供多文档ACID事务。它支持自动分片、内置复制、搜索和混合工作负载功能。主要使用场合包括全方位分析、实时分析、流分析、欺诈及风险管理以及其他多个工作负载。参考客户喜欢MongoDB的创新功能、更快创造价值的平台和技术支持。
微软开始因Azure Cosmos DB而备受追捧:Azure Cosmos DB是微软的全局分布式多模型数据库,让用户能够跨Azure地理区域弹性扩展计算和存储资源。作为一项基础的Azure服务,它在所有Azure区域均有提供。简化的数据库拥有宽松的一致性级别和低延迟访问,因而更容易开发全局分布式应用软件。Cosmos DB可自动为所有数据编制索引,不需要模式或二级索引,支持丰富的SQL和JavaScript查询,并提供多文档ACID事务。参考客户喜欢它的弹性、低维护、成本效益、高度扩展性、多模型支持以及更快地创造价值。他们将Cosmos DB用于操作型应用、实时分析、数据流分析和物联网分析。
Couchbase拥有一款高性能、高度扩展性的NoSQL产品:Couchbase是一种开源分布式多模型NoSQL数据库,针对交互式应用进行了优化。Couchbase旨在提供易于扩展的键值或文档存储、处理和访问,满足低延迟的需求。许多公司使用Couchbase支持大规模交互式使用场合,其中一些包括社交和移动/物联网应用、医疗保健、金融服务、内容及元数据存储、电子商务以及在线游戏等应用。Couchbase提供针对文档的全面支持、灵活的数据模型、索引、全文搜索以及面向实时分析的MapReduce。参考客户使用Couchbase来支持各种关键任务型工作负载,包括操作、分析和混合型工作负载。
AWS提供了支持诸多使用场合的几款NoSQL数据库:AWS DynamoDB是一种全面托管的NoSQL数据库即服务(DBaaS),针对各种类型的工作负载来部署,包括操作、事务和分析型工作负载。它可自动跨计算集群对数据进行分片,以支持大规模高性能的数据库部署。DynamoDB与AWS EMR和AWS S3紧密集成,提供存储和运行大数据计划的功能。 DynamoDB直接支持键值模型和文档模型以及地理空间数据集。除了DynamoDB外,AWS还提供Neptune等其他NoSQL数据库、图形数据库和时间序列数据库。许多企业使用DynamoDB支持社交媒体应用、游戏、实时及操作型工作负载、物联网应用以及其他电子商务应用。参考客户喜欢DynamoDB的支持、性能、规模和高可用性。
谷歌提供多款NoSQL数据库解决方案:谷歌提供两种NoSQL平台:Cloud Firestore和Cloud Bigtable。谷歌Cloud Firestore是一款与模式无关的Serverless数据库,为诸多类型的工作负载支持自动分片、高可用性、ACID事务、强一致性、类似SQL的查询、索引和持久性,但它针对移动、Web和物联网等应用。Cloud Bigtable是可扩展的宽列数据库服务, 与支持Search、Analytics、Maps和Gmail等许多谷歌服务的是同一种数据库。 Cloud Bigtable可灵活扩展,处理大量工作负载,为操作型应用和分析型应用同时确保低延迟和高吞吐量,包括物联网、用户分析、广告技术和财务数据分析等应用。参考客户喜欢谷歌的性能、开发者级别的灵活性、自动扩展性和易用性。
Redis Labs提供高性能的NoSQL数据库:Redis是一种多模型开源内存数据库平台,目前主要Redis Labs支持开发工作。Redis支持宽松的一致性和强一致性、灵活的无模式模型、高可用性和易部署性。企业版封装了开源软件,并借助高可用性和线性扩展为地域分布式双活部署(多云、混合和本地)提供额外的功能,同时支持开源API。许多公司将Redis用于客户全方位、机器学习、物联网、搜索和实时分析,以及电子商务、社交计费解决方案及其他使用场合。参考客户喜欢它针对机器学习应用的创新、性能、规模、客户支持以及支持众多NoSQL使用场合。
表现优异者
MarkLogic为众多使用场合提供了成熟的NoSQL数据库:MarkLogic是唯一一家十多年来一直提供NoSQL产品的NoSQL文档数据库供应商。它提供企业级功能,为众多使用场合存储、处理和访问各种数据集。MarkLogic可在本地、混合云和多云平台上运行,包括AWS、Azure和谷歌云平台。客户最常将MarkLogic部署于混合工作负载,包括事务、分析和操作型工作负载。一些客户将它用于客户全方位分析、医疗保健分析、实时分析、欺诈检测、信息发现、内容交付和数字供应链管理。参考客户喜欢它能够消除数据孤岛、更快地创造价值、安全性、搜索和简单性。
DataStax提供一款切实可行的NoSQL地域分布式数据库:DataStax发行、贡献和支持开源项目Apache Cassandra的商业企业版。DataStax继续有良好的执行力,支持需要对关键数据进行低延迟访问的全局应用。DataStax Enterprise(DSE)采用一种无主(masterless)、无共享(shared-nothing)的架构,拥有多模型和内存功能,以及可在本地或云端运行的内置分析和企业搜索功能。DataStax支持诸多类型的业务应用,包括事务、分析、事务分析(translytical)、预测分析、图形和混合工作负载。最常见的使用场合包括欺诈检测、产品目录、消费者个性化、推荐引擎和物联网等应用。参考客户喜欢它的分布式架构、技术支持、性能和低拥有成本。
Aerospike利用内存来支持高性能的NoSQL:Aerospike是一种键值分布式NoSQL数据库,提供横向扩展,拥有一种多层存储引擎以及为纯DRAM、DRAM/闪存和纯闪存存储设计的混合内存架构。它可大规模部署在公共云和私有云以及数据中心中,作为双许可证产品来提供。Aerospike被金融服务、电信、科技、零售、电子商务、广告技术和游戏等行业领域的企业所使用。使用场合包括推荐引擎、数字支付、欺诈检测及其他实时应用。参考客户喜欢它的速度、易扩展性、支持、低延迟、高可用性访问、简化的存储以及针对战略性操作型应用的访问。
Oracle的NoSQL是面向Oracle客户的一种方案:Oracle NoSQL数据库吸引寻求这些功能的公司:ACID事务、地理分布式数据、细粒度安全控制,并与Oracle Database、Oracle Wallet、Spark和Hadoop集成。Oracle NoSQL起源于键值数据库,但它也支持宽列表、无模式JSON和属性图形数据模型,提供出色的性能、扩展性、安全性和高可用性。许多Oracle客户使用Oracle NoSQL以兼顾这种情形:既需要较简单的键值数据的横向扩展工作负载,又需要核心业务系统中所需的丰富的关系数据管理功能集,或者支持频繁改变键值数据的新应用,比如欺诈检测、客户全方位分析和物联网等应用。
Neo4j是一种流行的NoSQL图形数据库,支持许多使用场景:Neo4j提供一款开源属性图形数据库,企业版包括集群、多个地区、安全性以及支持图形分析及算法、可视化图形发现及探索以及大数据集成的扩展件。成千上万的社区部署和300多个客户借助Neo4j利用关联的数据。Neo4j正推动一项多供应商计划,以开发ISO/WG3标准图形查询语言,Cypher语言和openCypher.org社区项目作出了贡献。参考客户喜欢它的原生存储和处理图形数据模型的功能,与ACID兼容的全面灵活的数据模型以及面向关联数据的高性能。客户常常将它用于实时推荐、AI、基于图形的搜索、社交网络、物联网分析、欺诈检测和主数据管理。
IBM Cloudant是一款切实可行的云NoSQL产品:IBM于2014年收购了Cloudant,以扩展其DBaaS,并支持诸多NoSQL使用场合。IBM Cloudant是一款全面托管的NoSQL文档数据库,与Apache CouchDB兼容。Cloudant文档一式三份存储在三个独立的可用区,以实现区域内高可用性和灾难恢复。客户将Cloudant用于实时分析、物联网分析、数据流分析和操作型工作负载。IBM为Cloudant提供托管、管理工具、分析和支持,部署在众多行业,包括金融服务业、游戏业、制造业、电信业、零售业和医疗保健业。
竞争者
SAP提供一款新的多模型NoSQL数据库:OrientDB。Callidus Software在2017年收购了OrientDB,SAP在2018年进而收购了Callidus。OrientDB是OrientDB的主要贡献者和支持者,而OrientDB是一款用Java编写的开源多模型NoSQL数据库,2010年首次发布。OrientDB支持无模式模型、混合模型和基于模式的模型,除了Gremlin和SPARQL外,还支持SQL这种查询语言。OrientDB拥有与ACID完全兼容的图形数据库,支持事务和操作型使用场合。参考客户提到多模型引擎、易用性、可靠性能和占用资源少是它的主要优点。 OrientDB的几大使用场合包括资产管理、网络管理、网络安全、社交网络、推荐引擎和欺诈检测。
ArangoDB为特定的使用场合提供良好的NoSQL数据库:ArangoDB是一款多模型NoSQL数据库,拥有单一数据库核心和名为AQL的统一查询语言,支持键值、文档和图形等数据模型。ArangoDB处理图形数据时提供可扩展查询。ArangoDB可以部署在本地和云端,包括AWS、谷歌云平台和微软Azure。参考客户喜欢它的图形支持、灵活的数据模型、查询语言和简单的方法。他们将ArangoDB用于事务和操作型工作负载,他们喜欢它让业务计划更快地创造价值。
RavenDB有一款切实可行的事务型NoSQL数据库:Hibernating Rhinos这家数据库提供商提供RavenDB,这种NoSQL事务数据库支持文档、键值和图形等数据模型。RavenDB在本地和云端运行,包括AWS和Azure。它支持空间数据、全文搜索、流行的编程及查询语言以及各种安全功能。RavenDB拒绝参加我们的调研。
评估概述
我们按照26个标准评估了供应商,我们将这些标准分为三大类:
当前产品。每家供应商在Forrester Wave图形垂直轴上的位置表示了当前产品的优势。评估这些解决方案的关键标准有:数据类型、应用开发、数据流、数据一致性、自助及自动化、事务、数据安全性、多模型、架构、性能、可扩展性、全局分布式、高可用性/灾难恢复、工具、工作负载和使用场合。
经营战略。横轴上的放置表示供应商战略的优势。我们评估了执行能力、路线图、专业服务、开源和技术支持。
市场实力。市场实力评分以图上的圆圈大小来表示,反映了每家供应商的产品收入、用户群、市场知名度、合作伙伴关系和覆盖范围。
NoSQL社群欢迎加入,群主微信:guanhongyan1023(备注任职单位+职位,否则不予通过)
相关阅读:
三大NoSQL数据库HBase、Cassandra和MongoDB大比拼|「云头条」
已证实:亚马逊将在2019年底之前弃用所有Oracle数据库
Gartner 2018 数据库(OPDBMS)魔力象限:阿里云、Actian、MongoDB 上榜
php 工程师执行 redis keys* 导致数据库宕机,造成损失 400 万元
阿里推出 PolarFS 分布式文件系统:将存储与计算分开,提升云数据库性能(附论文)
Salesforce因数据中心电力故障导致数据库故障而停运12个小时